智能论文笔记

Neural Strands: Learning Hair Geometry and Appearance from Multi-View Images

Radu Alexandru Rosu , Shunsuke Saito , Ziyan Wang , Chenglei Wu , Sven Behnke , Giljoo Nam

分类：计算机视觉

2022-07-28

我们提出了神经链，这是一个新颖的学习框架，用于对多视图图像输入进行准确的头发几何形状和外观进行建模。从任何观点都具有高保真视图依赖性效果，可以实时渲染学习的头发模型。我们的模型可实现直观的形状和风格控制，与体积同行不同。为了实现这些特性，我们提出了一种基于神经头皮纹理的新型头发表示，该神经头皮纹理编码每个Texel位置的单个链的几何形状和外观。此外，我们基于学习的头发链的栅格化引入了一个新型的神经渲染框架。我们的神经渲染是链的和抗氧化的，使渲染视图一致且逼真。将外观与多视图几何事先结合在一起，我们首次启用了外观的联合学习和从多视图设置的显式头发几何形状。我们证明了我们的方法在各种发型的忠诚度和效率方面的功效。

translated by 谷歌翻译

Multiface: A Dataset for Neural Face Rendering

Cheng-hsin Wuu , Ningyuan Zheng , Scott Ardisson , Rohan Bali , Danielle Belko , Eric Brockmeyer , Lucas Evans , Timothy Godisart , Hyowon Ha , Alexander Hypes

分类：计算机视觉

2022-07-22

近年来，人类面孔的影子化化身已经走了很长一段路，但是该地区的研究受到缺乏公开可用的高质量数据集的限制。在这项工作中，我们介绍了Multiface，这是一种新的多视图，高分辨率的人脸数据集，该数据集是从13个身份的神经面部渲染研究中收集的13个身份。我们介绍了Mugsy，这是一种大型多摄像机设备，可捕获面部表现的高分辨率同步视频。 Multiface的目的是缩小学术界高质量数据的可访问性的差距，并使VR触觉研究能够进行研究。随着数据集的释放，我们对不同模型体系结构对模型的新观点和表达式的插值能力进行消融研究。通过有条件的VAE模型作为我们的基线，我们发现添加空间偏见，纹理翘曲场和残差连接可改善新型视图合成的性能。我们的代码和数据可在以下网址获得：https：//github.com/facebookresearch/multiface

translated by 谷歌翻译

Drivable Volumetric Avatars using Texel-Aligned Features

Edoardo Remelli , Timur Bagautdinov , Shunsuke Saito , Tomas Simon , Chenglei Wu , Shih-En Wei , Kaiwen Guo , Zhe Cao , Fabian Prada , Jason Saragih

分类：计算机视觉

2022-07-20

逼真的触觉需要高保真的身体建模和忠实的驾驶才能使动态合成的外观与现实无法区分。在这项工作中，我们提出了一个端到端框架，该框架解决了建模和推动真实人的全身化身方面的两个核心挑战。一个挑战是驾驶头像，同时忠实地遵守细节和动态，而这些细节和动态无法被全球低维参数化（例如身体姿势）所捕捉。我们的方法支持驾驶穿着皱纹和运动的衣服化身，而真正的驾驶表演者展出了训练语料库。与现有的全局状态表示或非参数屏幕空间方法不同，我们介绍了Texel对准功能 - 一种本地化表示，可以利用基于骨架的参数模型的结构先验和同时观察到的稀疏图像信号。另一个挑战是建模临时连贯的衣服头像，通常需要精确的表面跟踪。为了避免这种情况，我们通过将体积原语的混合物扩展到清晰的物体，提出了一种新型的体积化头像表示。通过明确合并表达，我们的方法自然而然地概括了看不见的姿势。我们还介绍了局部视点条件，从而导致了依赖视图的外观的概括。拟议的体积表示不需要高质量的网格跟踪作为先决条件，并且与基于网格的对应物相比，具有显着的质量改进。在我们的实验中，我们仔细研究了我们的设计选择，并证明了方法的功效，超过了最新方法在挑战驾驶方案方面的最新方法。

translated by 谷歌翻译

Dressing Avatars: Deep Photorealistic Appearance for Physically Simulated Clothing

Donglai Xiang , Timur Bagautdinov , Tuur Stuyck , Fabian Prada , Javier Romero , Weipeng Xu , Shunsuke Saito , Jingfan Guo , Breannan Smith , Takaaki Shiratori

分类：计算机视觉

2022-06-30

尽管最近在开发动画全身化身方面取得了进展，但服装的现实建模（人类自我表达的核心方面之一）仍然是一个开放的挑战。最先进的物理模拟方法可以以交互速度产生现实行为的服装几何形状。但是，建模光真逼真的外观通常需要基于物理的渲染，这对于交互式应用来说太昂贵了。另一方面，数据驱动的深度外观模型能够有效地产生逼真的外观，但在合成高度动态服装的几何形状和处理具有挑战性的身体套构型方面挣扎。为此，我们通过对服装的明确建模介绍了姿势驱动的化身，这些化身表现出逼真的服装动力学和从现实世界数据中学到的逼真的外观。关键的想法是引入一个在显式几何形状之上运行的神经服装外观模型：在火车时，我们使用高保真跟踪，而在动画时期，我们依靠物理模拟的几何形状。我们的关键贡献是一个具有物理启发的外观网络，能够生成具有视图依赖性和动态阴影效果的影像逼真的外观，即使对于看不见的身体透明构型也是如此。我们对我们的模型进行了彻底的评估，并在几种受试者和不同类型的衣服上展示了不同的动画结果。与以前关于影迷全身化身的工作不同，我们的方法甚至可以为宽松的衣服产生更丰富的动力和更现实的变形。我们还证明，我们的配方自然允许服装与不同人的头像一起使用，同时保持完全动画，因此首次可以采用新颖的衣服来实现逼真的化身。

translated by 谷歌翻译

Garment Avatars: Realistic Cloth Driving using Pattern Registration

Oshri Halimi , Fabian Prada , Tuur Stuyck , Donglai Xiang , Timur Bagautdinov , He Wen , Ron Kimmel , Takaaki Shiratori , Chenglei Wu , Yaser Sheikh

分类：计算机视觉

2022-06-07

虚拟网格是在线通信的未来。服装是一个人身份和自我表达的重要组成部分。然而，目前，在培训逼真的布置动画的远程介绍模型的必需分子和准确性中，目前无法使用注册衣服的地面真相数据。在这里，我们提出了一条端到端的管道，用于建造可驱动的服装代表。我们方法的核心是一种多视图图案的布跟踪算法，能够以高精度捕获变形。我们进一步依靠跟踪方法生产的高质量数据来构建服装头像：一件衣服的表达和完全驱动的几何模型。可以使用一组稀疏的视图来对所得模型进行动画，并产生高度逼真的重建，这些重建忠于驾驶信号。我们证明了管道对现实的虚拟电视应用程序的功效，在该应用程序中，从两种视图中重建了衣服，并且用户可以根据自己的意愿进行选择和交换服装设计。此外，当仅通过身体姿势驱动时，我们表现出一个具有挑战性的场景，我们可驾驶的服装Avatar能够生产出比最先进的面包质量明显更高的逼真的布几何形状。

translated by 谷歌翻译

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao , Angela Fan , Christopher Akiki , Ellie Pavlick , Suzana Ilić , Daniel Hesslow , Roman Castagné , Alexandra Sasha Luccioni , François Yvon , Matthias Gallé

分类：自然语言处理

2022-11-09

Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.

translated by 谷歌翻译

Exploring the Distribution Regularities of User Attention and Sentiment toward Product Aspects in Online Reviews

Chenglei Qin , Chengzhi Zhang , Yi Bu

分类：自然语言处理

2022-09-08

[目的]更好地了解在线评论，并帮助潜在的消费者，商人和产品制造商有效地获得用户对产品方面的评估，本文从在线评论的时间角度来探讨了用户关注和对产品方面的情感分布规律性。 [设计/方法/方法]在线评论的时间特征（购买时间和审核时间之间的购买时间，审核时间和时间间隔），类似的属性聚类以及属性级别的情感计算技术是基于340k智能手机评论来使用的在JD.com（中国著名的在线购物平台）的三种产品中，探讨了本文中用户对产品方面的关注和情感的分布规律。 [调查结果]经验结果表明，幂律分布可以符合用户对产品方面的关注，并且在短时间间隔发布的评论包含更多产品方面。此外，结果表明，在短时间间隔内，产品方面的用户情感值显着更高/较低，这有助于判断产品的优势和弱点。 [研究局限性]本文无法获得更多具有时间特征的产品的在线评论，以验证发现，因为对购物平台的评论的限制限制了。 [原创性/价值]这项工作揭示了用户对产品方面的关注和情感的分布规律，这在协助决策，优化审查演示和改善购物体验方面具有重要意义。

translated by 谷歌翻译

Which structure of academic articles do referees pay more attention to?: perspective of peer review and full-text of academic articles

Chenglei Qin , Chengzhi Zhang

分类：自然语言处理

2022-09-05

目的本文的目的是探讨哪些学术文章裁判的结构将更加关注，具体内容裁判的重点是哪些特定内容，以及中国的分布是否与引用有关。设计/方法/方法首先，利用节标题和分层注意网络模型（HAN）的特征单词来识别学术文章结构。其次，根据PRC中规则提取的位置信息在不同结构中的分布。第三，分析通过卡方检验和TF-IDF在不同结构中提取的PRC特征单词的分布。最后，使用四种相关分析方法来分析PRC在不同结构中的分布是否与引用相关。发现在材料和方法和结果部分中分布的PRC计数远远超过了引言和讨论的结构，这表明裁判员更多地关注材料，方法和结果。中国在不同结构中的特征单词的分布显然是不同的，这可以反映裁判员关注的内容。中国在不同结构中的分布与引用之间没有相关性。由于裁判员写同行评审报告的差异，研究的局限性/含义，用于提取位置信息的规则不能涵盖所有中国的所有中国。原创性/价值本文在不同的学术文章结构中发现了中国分布的一种模式，证明了长期的经验理解。它还提供了对学术文章写作的见解：研究人员应确保方法的科学性和撰写学术文章的结果的可靠性，以获得裁判的高度认可。

translated by 谷歌翻译

Between words and characters: A Brief History of Open-Vocabulary Modeling and Tokenization in NLP

Sabrina J. Mielke , Zaid Alyafeai , Elizabeth Salesky , Colin Raffel , Manan Dey , Matthias Gallé , Arun Raja , Chenglei Si , Wilson Y. Lee , Benoît Sagot

分类：自然语言处理 | 机器学习

2021-12-20

我们想要模型的文本单位是什么？从字节到多字表达式，可以在许多粒度下分析和生成文本。直到最近，大多数自然语言处理（NLP）模型通过单词操作，将那些作为离散和原子令牌处理，但从字节对编码（BPE）开始，基于次字的方法在许多领域都变得占主导地位，使得仍然存在小词汇表允许快速推断。是道路字符级模型的结束或字节级处理吗？在这项调查中，我们通过展示和评估基于学习分割的词语和字符以及基于子字的方法的混合方法以及基于学习的分割的杂交方法，连接多行工作。我们得出结论，对于所有应用来说，并且可能永远不会成为所有应用的银子弹奇异解决方案，并且严重思考令牌化对许多应用仍然很重要。

translated by 谷歌翻译

Sub-Character Tokenization for Chinese Pretrained Language Models

Chenglei Si , Zhengyan Zhang , Yingfa Chen , Fanchao Qi , Xiaozhi Wang , Zhiyuan Liu , Yasheng Wang , Qun Liu , Maosong Sun

分类：自然语言处理

2021-06-01

令牌化是预用语言模型（PLMS）的基础。用于中文PLMS的现有销量化方法通常将每个角色视为不可分割的令牌。然而，它们忽略了中文写字系统的独特特征，其中附加语言信息在字符级别下方，即在子字符级别。要利用此类信息，我们提出了子字符（Sub Const for Short）标记。具体地，我们首先通过基于其字形或发音将每个汉字转换为短序列来编码输入文本，然后根据具有子字标记化的编码文本构造词汇表。实验结果表明，Sub Colar标记与现有标记均具有两个主要优点：1）它们可以将输入牌销料到更短的序列中，从而提高计算效率。 2）基于发音的Sub Col.Tokenizers可以将中文同音铭器编码为相同的音译序列并产生相同的标记输出，因此对所有同音声音拼写的强大。与此同时，使用Sub Colar标记培训的模型竞争地执行下游任务。我们在https://github.com/thunlp/subchartoken中发布我们的代码，以促进未来的工作。

translated by 谷歌翻译